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El presente ensayo pretende orientar a los 
noveles investigadores en el procedimiento 
para elaborar un instrumento adecuado para 
la recoleccion de datos, valido y confiable, que 
proporcione un basamento relevante para el 
logro de los objetivos planteados y sustente los 
hallazgos que realicen con sus investigaciones. 
Se describe la validez y la confiabilidad de un 
instrumento. Como se realiza el calculo de la 
confiabilidad y cuales son los instrumentos 
que requieren de este procedimiento, ya que 
no todos los instrumentos para recabar datos 
ameritan se realice una prueba piloto con esta 
finalidad. 
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VALIDITY AND RELIABILITY OF THE INSTRUMENTS 
TO COLLECT DATA 

ABSTRACT 

This essay aims to provide guidance to junior researchers in the procedure 
for developing a suitable instrument for data collection, valid and reliable, 
providing a basement relevant to achieving the goals set and underpins the 
findings to conduct its investigations. It describes the validity and reliability of 
an instrument. How is the calculation of reliability and what are the instruments 
that require this procedure? Since not all instruments to collect data warrant a 
pilot test is conducted for this purpose. 

Keywords: Validity. Reliability. Instrument Research. 



INTRODUCCION 

La problematica al momento de la recoleccion de datos en la realizacion 
de los Trabajos de investigacion se centra en la construccion de los 
instrumentos a emplear con esta finalidad, de manera que permitan recabar 
informacion valida y confiable. Porque el valor de un estudio depende de 
que esta informacion refleje lo mas fidedignamente el evento investigado, 
dandole una base real para obtener un producto investigativo de calidad. Por 
lo anterior, el presente ensayo pretende orientara los noveles investigadores 
en el procedimiento para elaborar instrumentos adecuados que proporcionen 
un basamento relevante para el logro de los objetivos planteados en la 
investigacion abordada y sustenten los hallazgos que se realicen. 

Siempre que se quiere recopilar informacion a fin de ayudarnos a tomar 
decisiones, nos enfrentamos al problema de que tipo de instrumento usar 
o si realmente hay un cuestionario que nos ayude a tomar la decision. En 
este sentido, un instrumento segun Alvarado, Canales y Pineda (1994) 
“...es el mecanismo que utiliza el investigador para recolectar y registrar 
la informacion” (pp.125). Con este proposito, es imperativo saber si el 
instrumento a disenar nos ayudara a contar con informacion util y fidedigna 
sobre el problema de estudio, en cuyo caso ^cual sera el mejor que podamos 
usar?, ^como hacer la seleccion tanto del instrumento como de los reactivos 
que la formen?. Existen muchas consideraciones especificas a tomar en 
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cuenta en la evaluacion de un cuestionario; las cuales las englobaremos bajo 
tres encabezados principales: validez, confiabilidad y utilidad practica. 

Ebel (1977, citado por Fuentes, 1989) establece que validez“...designa 
la coherencia con que un conjunto de puntajes de una prueba miden aquello 
que deben medir” (p. 1 03). La validez se refiere al grado en que una prueba 
proporciona informacion que es apropiada a la decision que se toma. La 
confiabilidad tiene que ver con la exactitud y precision del procedimiento 
de medicion. Los coeficientes de confiabilidad proporcionan una indicacion 
de la extension, en que una medida es consistente y reproducible. La 
utilidad practica esta relacionada con factores, tales como: economia, 
conveniencia e interpretacion para determinar si una prueba es practica 
para usarla ampliamente. 



Validez 

La validez responde a la pregunta <-,con que fidelidad corresponde 
el universo o poblacion al atributo que se va a medir?. La validez de un 
instrumento consiste en que mida lo que tiene que medir (autenticidad), 
algunos procedimientos a emplear son: Know groups (preguntar a grupos 
conocidos), Predictive validity (comprobarcomportamiento) y Cross-check- 
questions (contrastar datos previos). Al estimar la validez es necesario saber 
a ciencia cierta que rasgos o caracteristicas se desean estudiar. Aeste rasgo 
o caracteristica se le denomina variable criterio. Al respecto, Ruiz Bolivar 
(2002) afirma que “...nos interesa saber que tan bien corresponden las 
posiciones de los individuos en la distribucion de los puntajes obtenidos con 
respecto a sus posiciones en el continuo que representa la variable criterio” 
(p. 74). Existen tres tipos de validez: 

o Validez de Contenido: se refiere al grado en que un instrumento 
refleja un dominio especifico del contenido de lo que se quiere 
medir, se trata de determinar hasta donde los itemes o reactivos de 
un instrumento son representativos del universo de contenido de la 
caracteristica o rasgo que se quiere medir, responde a la pregunta 
cuan representativo es el comportamiento elegido como muestra 
del universo que intenta representar. Por ejemplo, un cuestionario 
sobre la actitud de los alumnos ante la investigacion no tendra 
validez de contenido si explora la opinion de los alumnos sobre las 
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caracteristicas de los docentes dentro de la catedra de estadistica. 
Tambien se le denomina validez racional o logica. 

El analisis del instrumento se hace en gran parte en terminos de su 
contenido. Sin embargo, no se debe pensar en el contenido de manera 
estrecha, porque puede ser que estemos interesados en un proceso tanto 
como en el contenido simplemente. El problema de apreciar la validez de 
contenido esta vinculado intimamente con la planificacion del cuestionario y 
despues con la construccion de los itemes ajustados a esos planes y a los 
contenidos del marco teorico de la investigacion. Un instrumento de medicion 
debe tener representados a todos los itemes del dominio de contenido de 
las variables a medir. 

Los investigadores deben elaborar una serie de i'temes, acordes con las 
variables empleadas y sus respectivas dimensiones. Luego de la seleccion 
de los itemes mas adecuados para el proyecto, se elabora el instrumento, 
para ser validado por un grupo impar de expertos, normalmente de tres 
o cinco, que certifiquen, efectivamente, que las preguntas, reactivos o 
afirmaciones seleccionadas son claras y tienen coherencia con el trabajo 
desarrollado. 

Hay que considerar que, la validez de contenido no puede expresarse 
cuantitativamente es mas bien una cuestion de juicio, se estima de manera 
subjetiva o intersubjetiva empleando, usualmente, el denominado Juicio de 
Expertos. Se recurre a ella para conocer la probabilidad de error probable en 
la configuracion del instrumento. Mediante el juicio de expertos se pretende 
tener estimaciones razonablemente buenas, las «mejores conjeturas». Sin 
embargo, estas estimaciones pueden y deben serconfirmadas o modificadas 
a lo largo del tiempo, segun se vaya recopilando informacion durante el 
funcionamiento del sistema. Los juicios de expertos se pueden obtener por 
metodos grupales o por metodos de experto unico. Se pueden seguir, entre 
otros, el metodo de Agregados Individuales, el metodo Delphi, la tecnica de 
Grupo Nominal y el metodo de Consenso Grupal. 

o Metodo de Agregados Individuales: Se pide individualmente a cada 
experto que de una estimacion directa de los items del instrumento. 

Este es un metodo economico porque, al igual que el metodo Delphi, 
no exige que se reuna a los expertos en un lugar determinado. 
Puede parecer un metodo limitado porque los expertos no pueden 
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intercambiar sus opiniones, puntos de vista y experiencia, ya que 
se les requiere individualmente; no obstante, esta limitacion puede 
ser precisamente lo que se este buscando para evitar los sesgos 
de los datos ocasionados por conflictos interpersonales, presiones 
entre los expertos, etc. Se procede de la siguiente manera: 

•/ Se seleccionan al menos tres expertos o jueces, para juzgar de 
manera independiente la relevancia y congruencia de los reactivos 
con el contenido teorico, la claridad en la redaccion y el sesgo o 
tendenciosidad en la formulacion de los itemes, es decir, si sugieren 
o no una respuesta. 

S Cada experto debe recibir la informacion escrita suficiente sobre: el 
proposito de la prueba (objetivos), conceptualizacion del universo 
de contenido, tabla de especificaciones o de operacionalizacion de 
las variables del estudio. 

v' Cada experto debe recibir un instrumento de validacion que 
contenga: congruencia item-dominio, claridad, tendenciosidad o 
sesgo y observaciones. 

v' Se recogen y analizan los instrumentos de validacion y se 
decide: 

1) Los itemes que tienen 100% de coincidencia favorable entre 
losjueces (congruentes, claros en su redaccion y notendenciosos) 
quedan incluidos en el instrumento 

2) Los itemes que tengan 1 00% de coincidencia desfavorable 
entre los jueces quedan excluidos del instrumento 

3) Los ftemes que tengan una coincidencia parcial entre los jueces 
deben ser revisados, reformulados o sustituidos, si es necesario, y 
nuevamente validados. 
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Cuadro 1 . Formato para validar instrumentos a incluir en el instrumento de 
validacion. 



(tem 


CRITERIOS A EVALUAR 


Observaciones 

(si debe 
eliminarse o 
modificarse un 
item por favor 
indique) 


Clarldad 
en la 

redaccion 


Coherencia 

interna 


Induccion 
a la 

respuesta 

(Sesgo) 


Lenguaje 
adecuado 
con ei 
nivel del 
informante 


Mide 
lo que 
pretende 


Sf 


No 


Si 


No 
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No 


Si 


No 


Si 


No 
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Aspectos Generales 


Si 


No 


******** 


El instrumento contiene instrucciones claras y precisas 
para responder el cuestionario 








Los itemes permiten el logro del objetivo de la 
investiaacion 








Los Itemes estan distribuidos en torma logica y 
secuencial 








El numero de itemes es suficiente para recoger la 
informacion. En caso de ser negativa su respuesta, 
sugiera los itemes a anadir 








VALIDEZ 


APLICABLE | | NO APLICABLE 




APLICABLE ATENDIENDO A LAS OBSERVACIONES 




Validado por: 


C.I.: 


Fecha: 


Firma: 


Telefono: 


e-mail: 


Nota. Modificado de Formato de la Facultad de Odontologia de la Universidad de 

Carabobo (2007). 



o Metodo Delphi: Este metodo fue creado en 1948 para obtener 
la opinion de expertos de una manera sistematica. En un primer 
momento, cada experto responde de manera individual y anonima 
a un cuestionario. Despues se analizan las respuestas del conjunto 
de expertos, se remite a cada uno la respuesta mediana obtenida, 
asi como el intervalo intercuartil para cada cuestion y se les pide 
que reconsideren su juicio anterior, teniendo en cuenta estos datos. 
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En cada una de las tres o cuatro «vueltas» siguientes, se informa 
a los expertos de cual es la mediana del grupo y se les propone 
revisar su juicio anterior. Todo juicio individual que quede fuera del 
intervalo intercuartil en que se mueve el grupo de expertos tiene 
que estar debidamente justificado o argumentado. La mediana de 
las respuestas obtenidas en esta ultima vuelta es el valor que se 
estaba buscando. Se emplea la mediana, porque se presupone que 
las puntuaciones posibles de los expertos se distribuyen de forma 
asimetrica. Con este metodo los expertos comparten en cierto 
modo sus opiniones, sin que existan discusiones ni confrontaciones 
directas entre ellos. 

o Tecnica de Grupo Nominal: El primer paso es reunir a los 
expertos (entre ocho y diez personas) y pedirles que registren, 
individualmente y sin intercambiar opiniones, sus propias 
puntuaciones y consideraciones respecto a las probabilidades de 
error para cada una de las preguntas o tareas que se les detallan. 
Despues, cada experto expone a los demas las puntuaciones y 
principales consideraciones registradas y al acabar esta ronda, 
se establecen las coincidencias del grupo. Luego se realiza un 
debate de cada uno de los apartados de esta. Finalmente, cada 
experto, de manera individual y por escrito, puntua y argumenta las 
probabilidades de error para cada tarea/pregunta considerada. 

En general, se procede como con el metodo Delphi, solo que en 
esta tecnica se permite algun debate entre los expertos, para que 
aclaren y compartan la informacion que cada uno esta considerando. 
Aunque hay intercambio de pareceres, los juicios se emiten de 
forma individual y la estimacion final suele ser la media aritmetica 
del conjunto de las estimaciones dadas por los expertos. El exito de 
la tecnica depende, por una parte, de la habilidad y la experiencia 
del moderador del grupo y de la buena voluntad de los expertos 
para trabajar juntos en un marco altamente estructurado. 

o Metodo del Consenso Grupal: Se reune a los expertos en un lugar 
determinado, se indica al grupo que su tarea consiste en lograr 
una estimacion de la pertinencia y otros aspectos relacionados con 
la elaboracion de los itemes, que sea satisfactoria para todos los 
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expertos. Con estas instrucciones se maximizan los intercambios 
de informacion y opiniones dentro del grupo de expertos. Si 
el grupo no logra un consenso, puede intentarse un consenso 
artificial recogiendo las estimaciones individuales y sintetizandolas 
estadisticamente. Este metodo, como el anterior, tambien precisa 
que el grupo de expertos sea pequeno, se fomente la libre expresion 
y se eviten las discusiones tensas y los sistemas de votacion. 

o Validez de Constructo: intenta responder la pregunta ^hasta donde 
el instrumento mide realmente un rasgo determinado y con cuanta 
eficiencia lo hace?. Al respecto Gronlund (1976, citado por Ruiz 
Bolfvar, op. cit.) senala que esta validez interesa cuando se quiere 
usar el desempeno de los sujetos con el instrumento para inferir 
la posesion de ciertos rasgos. Para estudiar este tipo de validez 
es necesario que exista una conceptualizacion clara del rasgo 
estudiado basado en una teori'a determinada. La teoria sugiere las 
tareas pruebas que son apropiadas para observar el atributo o rasgo 
y las evidencias a considerarse en la evaluacion. Cronbach (1960, 
citado por Ruiz Boh'var, op. cit.) sugiere los siguientes pasos: 

1 ) Identificar las construcciones que pudieran explicar la ejecucion 
en el instrumento 

2) Formulacion de hipotesis comprobables a partir de la teoria 

3) Recopilacion de los datos para probar las hipotesis 

El termino constructo se usa en psicologfa para referirse a algo que no 
es observable, pero que literalmente es construido por el investigador para 
resumir o explicar las regularidades o relaciones que el observa en la conducta. 
Portanto, la mayoria de los nombres de rasgos se refieren a constructos. Para 
las preguntas acerca de si el instrumento revela algo significativo respecto 
de las personas, se usa el termino validez de constructo. 

Muchas pruebas psicologicas, y en menor medida algunas pruebas 
educativas, intentan medir rasgos generales o cualidades de un individuo, 
tales como: razonamiento verbal, visualizacion especial, sociabilidad, 
introversion e interes mecanico son designaciones de constructos o de 
rasgos. Las pruebas de estas funciones son validas en tanto se comporten 
de la manera que cabria esperar que se comportara el rasgo. 
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o Validez Predictiva o de Criterio Externo o Empfrica: se asocia 
con la vision de futuro, determinar hasta donde se puede anticipar 
el desempeno futuro de una persona en una actividad determinada. 

La validez predictiva se estudia comparando los puntajes de 
un instrumento con una o mas variables externas denominadas 
variables de criterio. Se establece una correlacion, la cual se 
interpreta como i'ndice de validez. 

Para este proposito, estamos interesados en el grado en que el 
instrumento se correlaciona con algunos de los criterios escogidos para 
medir, por ejemplo: el exito en los estudios. Asi', se toma alguna otra medida, 
como el criterio del “exito”, y juzgamos el cuestionario elaborado en terminos 
de su relacion con esa medida de criterio. El procedimiento basico consiste 
en aplicar la prueba a un grupo de personas que ingresan a un trabajo o 
a un programa de entrenamiento y, posteriormente, seguirlas observando 
para obtener de cada una, una medida criterio de exito especifica y luego 
calcular la correlacion entre la puntuacion de prueba y la medida criterio 
de exito. Cuanta mas alta sea la correlacion, mejor sera el instrumento, 
es decir, la evaluacion como predictor es principalmente una evaluacion 
empirica y estadistica. 

Cualidades deseables en una medida criterio: Existen cuatro cualidades 
deseables en una medida criterio, en orden de importancia son: 

Atingencia - Se consideran que un criterio es atingente en la media 
en que esta medida criterio corresponde con o ejemplifica el exito 
en el trabajo. 

Libre de sesgos - La medida deberia ser aquella en la que cada 
persona tiene las mismas oportunidades de obtener una buena 
puntuacion. 

Confiabilidad- Debe ser estable o reproducible si ha de ser predicha 
por algun tipo de prueba. 

Disponibilidad- Debe tener en cuenta limites practicos como: ^Que 
tanto se debe esperar para obtener una puntuacion?, d,Cuanto 
dinero costaran las interrupciones de las actividades? 
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Factores que Afectan la Validez 

Existen varios factores que tienden a distorsionar los coeficientes de 
validez y a complicar su interpretacion, entre ellos: 

o Construccion del Instrumento. Algunos de los factores a evitar, 
para que el instrumento sea valido son: 



Instrucciones imprecisas o vagas 

Estructura sintactica de las oraciones muy diffciles 

Preguntas inadecuadas respecto a las especificaciones (sobre todo 
en pruebas escritas y orales) 

Preguntas que sugieren la respuesta 

Ambiguedad en la formulacion de los reactivos, que lleven a 
diferentes interpretaciones 

Cuestionarios demasiado cortos (no incluyen una muestra adecuada 
de los indicadores a medir), con pocos reactivos 

Itemes incongruentes con el universo de contenido, sin relacion con 
los rasgos o caracteristicas a medir 

Ordenamiento inadecuado de los ftemes 

Patron identificable de respuestas (sobre todo en pruebas de 
seleccion) 

o Administracion y Calificacion del Instrumento. Entre estos 
factores estan: tiempo insuficiente para responder, ayuda adicional 
de otros sujetos, en caso de pruebas: las chuletas o copias, la 
subjetividad en los puntajes de las preguntas. 

o Respuestas de los Sujetos. Algunos factores: bloqueo de los 
sujetos al responder debido a situaciones emocionales y las 
respuestas al azar. 

o Naturaleza del Grupo y del Criterio. Debe ser aplicado el 
instrumento para el grupo al cual fue disenado, puede ser 
inapropiado para otros grupos. 
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Confiabilidad 

Antes de iniciar el trabajo de campo, es imprescindible probar el 
cuestionario sobre un pequeno grupo de poblacion. Esta prueba piloto ha 
de garantizar las mismas condiciones de realizacion que el trabajo de campo 
real. Se recomienda un pequeno grupo de sujetos que no pertenezcan a la 
muestra seleccionada pero si a la poblacion o un grupo con caracteristicas 
similares a la de la muestra del estudio, aproximadamente entre 14 y 30 
personas. De esta manera se estimara la confiabilidad del cuestionario. 

La confiabilidad responde a la pregunta ^con cuanta exactitud los itemes, 
reactivos o tareas representan al universo de donde fueron seleccionados?. 
El termino confiabilidad “...designa la exactitud con que un conjunto de 
puntajes de pruebas miden lo que tendrfan que medir” (Ebel, 1 977, citado por 
Fuentes, op. cit., p. 103). Entre los metodos paraestimar la confiabilidad, 
se tienen: 

v' Metodo Test-Retest: una forma de estimar la confiabilidad de un 
test o cuestionario es administrarlo dos veces al mismo grupo y 
correlacionar las puntuaciones obtenidas. Este metodo tiene la 
desventaja de que los puntajes pueden verse afectados por el 
recuerdo, la practica, etc. Este procedimiento no es adecuado 
para aplicarlo a pruebas de conocimientos sino para la medicion 
de aptitudes fisicas y atleticas, tests de personalidad y motores. 

El coeficiente que se obtiene recibe el nombre de coeficiente de 
estabilidad porque denota la coherencia de las puntuaciones en el tiempo. 
Para un desarrollo adecuado y sean confiables deben variar entre 0,80 y 
0,95 (Popham, 1980, citado por Fuentes, op. cit.). 

Se usa la correlacion por el metodo de los puntajes directos 
(Correlacion r de Pearson): 



NlXY -IXIY 

^XV I 

pIX 2 -(IX ) 2 [ NlY 2 -(SF) 2 ] 
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En donde: 

r xy : es el coeficiente de correlacion 
N: numero de sujetos 
X: valores de X (1 a aplicacion) 

Y: valores de Y ( 2 - aplicacion) 

XY: producto de cada valor X por su correspondiente valor en Y 

Cuadro 2. Tabla de Datos para aplicar el Coeficiente de Correlacion r de 
Pearson. 





I 3 Aplicacion 


2 3 Aplicacion 




Test 


Retest 


Sujetos 


X X 2 


Y Y 2 



1 

2 

3 

ETC 

X 



s Metodo comun de division por mitades o Hemitest: este metodo 
computa el coeficiente de correlacion entre los puntajes de las dos 
mitades del test o cuestionario aplicado. Esto supone que las dos 
test mitades son paralelos, tienen igual longitud y varianza entre si. 
Se estima a traves del coeficiente de confiabilidad de Spearman- 
Brown: 

i) Se establece la correlacion entre los dos puntajes de las dos mitades 
del test a traves del metodo de los puntajes directos, Correlacion 
r de Pearson: 

r 12 ~ I ~ = 

■JlNZX , 2 ~(IX,) 2 l NIX 2 ~(IX 2 ) 2 
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ii) Estimacion del test completo (Spearman-Brown) con la formula: 



Se interpreta la prueba de hemitest como coeficiente de consistencia 
interna, ya que una sola prueba contiene las dos formas equivalentes y su 
enfasis lo pone en las puntuaciones de los sujetos, no en los itemes. 

s El metodo de division por mitades de Rulon: utiliza la division 
del test en mitades, pero su metodo no supone necesariamente 
varianzas iguales en los sub-tests. coeficiente de consistencia 
interna. 




r [f : coeficiente de confiabilidad 

s : varianza de la diferencia entre las puntuaciones de las mitades 
s ] : varianza de las puntuaciones del test total 

S El metodo de division por mitades de Guttman: tambien se 
denomina coeficiente de consistencia interna. Su formula es: 



2 rn 




1 + r 12 




2 



2 



] 



Donde: 

r : coeficiente de confiabilidad 
s^ : varianza de las puntuaciones de los itemes pares 
s l : varianza de las puntuaciones de los itemes impares 
s ] : varianza de las puntuaciones del test total 
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s Coefiente Alfa de Cronbach: Para evaluar la confiabilidad o la 
homogeneidad de las preguntas o itemes es comun emplear el 
coeficiente alfa de Cronbach cuando se trata de alternativas de 
respuestas policotomicas, como las escalas tipo Likert; la cual puede 
tomar valores entre 0 y 1 , donde: 0 significa confiabilidad nula y 1 
representa confiabilidad total. El coeficiente a de Cronbach puede 
ser calculado por medio de dos formas: 

k 




a) Mediante la varianza de los itemes y la varianza del puntaje total 
(Hernandez Sampieri et al, 2003) 

Donde: 

r tt coeficiente de confiabilidad de la prueba o cuestionario. 
k: numero de items del instrumento. 
s t 2 : Varianza total del instrumento. 

Is 2 : Sumatoria de las varianzas de los items. 

Cuanto menor sea la variabilidad de respuesta, es decir, que haya 
homogeneidad en las respuestas dentro de cada item, mayor sera el Alfa 
de Cronbach. 

b) Mediante la matriz de correlacion de los itemes. 

a = 

1 + p{n — 1 ) 

Donde: 

n: Numero de itemes p: Promedio de las correlaciones lineales 
entre cada uno de los itemes 




241 



VALIDEZ Y CONFIABILIDAD DE LOS INSTRUMENTOS DE INVESTIGACION 
PARA LA RECOLECCION DE DATOS 

Yadira Corral 
p.p 228-247. 



Cuanto mayor sea la correlacion lineal entre itemes, mayor sera el alfa 
de Cronbach. 

•/ Metodo de Kuder-Richarson 20: permite obtener la confiabilidad 
a partir de los datos obtenidos en una sola aplicacion del test. 
Coeficiente de consistencia interna. Puede ser usada en 
cuestionarios de itemes dicotomicos y cuando existen alternativas 
dicotomicas con respuestas correctas e incorrectas. 

KR _ n r s'-l.pq i 

n — 1 s t 

Donde: 



n: numero total de itemes 

s 2 t : varianza de las puntuaciones totales 

p: proporcion de sujetos que pasaron un item sobre el total de sujetos 
q = i- P 

•/ Metodo de Kuder-Richarson 21 : permite obtener la confiabilidad 
a partir de los datos obtenidos en una sola aplicacion del test. La 
suposicion basica es considerar que todos los ftemes presentan 
igual varianza. Coeficiente de consistencia interna. 

KR _ n n M(n — M) , 

21 ~ . L 1 2 J 

n - 1 ns t 

Donde: 

n: numero total de itemes 



M: media aritmetica de las puntuaciones obtenidas por los individuos 
s 2 : varianza de las puntuaciones totales 

Los datos obtenidos de la prueba piloto deben organizarse segun el 
cuadro 3. 
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Cuadro 3. Distribucion de las respuestas dadas al instrumento o al cuestionario 
en la prueba piloto (Alfa de Cronbach y Kuder-Richarson). 



Sujeto 


Itemes o Reactivos 


1 


2 


3 


4 


5 


6 




k 


1 


Ptaje 


Ptaje 


Ptaje 


Ptaje 


Ptaje 


Ptaje 




Ptaje 


2 


Ptaje 


Ptaje 


Ptaje 


Ptaje 


Ptaje 


Ptaje 




Ptaje 


3 


Ptaje 


Ptaje 


Ptaje 


Ptaje 


Ptaje 


Ptaje 




Ptaje 


4 


Ptaje 


Ptaje 


Ptaje 


Ptaje 


Ptaje 


Ptaje 




Ptaje 


5 


Ptaje 


Ptaje 


Ptaje 


Ptaje 


Ptaje 


Ptaje 




Ptaje 


6 


Ptaje 


Ptaje 


Ptaje 


Ptaje 


Ptaje 


Ptaje 




Ptaje 


7 


Ptaje 


Ptaje 


Ptaje 


Ptaje 


Ptaje 


Ptaje 




Ptaje 


m 


Ptaje 


Ptaje 


Ptaje 


Ptaje 


Ptaje 


Ptaje 




Ptaje 



Nota. m = numero de sujetos a los cuales se aplico la prueba piloto; k 
= numero de itemes del cuestionario o instrumento. Se usa para el Alfa de 
Cronbach y para Kuder-Richarson. En cada casilla se colocara el puntaje 
asignado a la opcion seleccionada por el informante. Por ejemplo: Siempre (5), 
casi siempre (4), Indeciso (3), Casi nunca (2), nunca (1); Sf (1) - No (0). 

Interpretacion del Coeficiente de Confiabilidad 

El coeficiente de confiabilidad es un coeficiente de correlacion, 
teoricamente significa la correlacion del test consigo mismo. Sus valores 
oscilan entre 0 y 1 . Entre las escalas empleadas se tienen las mostradas 
en los cuadros siguientes. 

Cuadro 4. Escala de interpretacion de la magnitud del Coeficiente de 
Correlacion o Asociacion. 



Coeficiente de Correlacion 


Magnitud 


0,70 a 1,00 


Muy fuerte 


0,50 a 0,69 


Sustancial 


0,30 a 0,49 


Moderada 


0,10 a 0,29 


Baja 


0,01 a 0,09 


Despreciable 



Nota. Tomado de Sierra Bravo (2001). 
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Cuadro 5. Interpretacion de la magnitud del Coeficiente de Confiabilidad de 
un instrumento. 



Rangos 


Magnitud 


0,81 a 1,00 


Muy Alta 


0,61 a 0,80 


Alta 


0,41 a 0,60 


Moderada 


0,21 a 0,40 


Baja 


0,01 a 0,20 


Muy Baja 



Nota. Tomado de Ruiz Bolfvar (2002) y Pallella y Martins (2003). 



Cuadro 6. Interpretacion de la magnitud del Coeficiente de Confiabilidad de 
un instrumento. 



Correlacion 


Directa 


Indirecta 


Alta 


0,70 a 1,00 


-1,00 a -0,70 


Moderada 


0,40 a 0,70 


-0,70 a -0,40 


Baja 


0,10 a 0,40 


-0,10 a -0,10 


Nula 


-0,10 a 0,10 


-0,10 a 0,10 



Nota. Tomado de Orozco, Labradory Palencia (2002). Estacaracterizacion es 
valida para n>20, puesto que el tamano puede afectar el valor del coeficiente 
de correlacion. 



En el Cuadro 7, se muestra un resumen de los metodos. 

Cuadro 7. Resumen de los Metodos y Tecnicas para estimar la confiabilidad 
de un instrumento. 



Metodo 


Tecnica 


Proposito 


Test-Retest 


Coeficiente de correlacion r de 
Pearson 


Consistencia en el tiempo de 
los puntajes 


Formas 

equivalentes 


Coeficiente de correlacion r de 
Pearson 


Coeficiente de equivalencia, 
variacion en el tiempo de los 
puntajes 


Division por 
mitades 


Correlacion de Pearson 
Correlacion de Spearman-Brown 
Coefiente de Rulon 
Coeficiente de Guttman 


Establecer la homogeneidad 
de los itemes al medir el 
constructo 


Homogeneidad 
de las 

preguntas o 
itemes 


Coeficiente Alfa de Cronbach 
Coeficiente de Kuder Richarson 20 


Para escalas policotomicas 
como las tipo Likert 


Coeficiente de Kuder Richarson 20 


Para itemes con escalas 
dicotomicas 



Nota: Tomado de Palella y Martins (2003), p. 155. 
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Como colofon, cabe destacar que, existen instrumentos para recabar 
datos que por su naturaleza no ameritan el calculo de la confiabilidad, 
como son: entrevistas, escalas de estimacion, listas de cotejo, guias de 
observacion, hojas de registros, inventarios, rubricas, otros. A este tipo 
de instrumentos, sin embargo, debe estimarse o comprobarse su validez, 
a traves del juicio de expertos, para establecer si los reactivos que los 
configuran o integran se encuentran bien redactados y miden lo que se 
pretende medir. 

Igualmente, instrumentos como la Historia Ch'nica no ameritan el calculo 
de la confiabilidad; debido a que, usualmente, ya se encuentra validada por 
su uso frecuente y su confiabilidad se ha comprobado por sus aciertos, en 
otras palabras, es un instrumento ya estandarizado. Al respecto, la Historia 
Ch'nica es definida por Guzman Mora (2006) como una de las formas de 
registro del acto medico y, en esencia, son los profesionales de la salud 
quienes estan en capacidad de practicar una buena Historia Ch'nica; 
conceptualizada como el documento medico y clinico por excelencia. 
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